AI-HERO Hackathon für energieeffiziente KI
Der enorme Strombedarf großer IT-Infrastrukturen ist eine ökologische Herausforderung. Der erste AI-HERO Hackathon hat das Bewusstsein für den Energieverbrauch moderner KI-Forschung und -Entwicklung geweckt und zur Verbreitung von „Green IT“-Ansätzen beigetragen.
In den letzten zehn Jahren hat künstliche Intelligenz (KI) in vielen Bereichen der Wissenschaft und Technik große Fortschritte ermöglicht. Mit dem zunehmenden Einsatz von KI in immer komplexeren Fragestellungen wächst jedoch auch der dafür erforderliche Bedarf an Rechenressourcen. Moderne Beschleunigerhardware und große Computercluster ermöglichen zwar die Implementierung immer größer werdender KI-Modelle, der enorme Strombedarf dieser IT-Infrastrukturen stellt jedoch zunehmend eine Herausforderung dar, insbesondere im Hinblick auf den Klimawandel und den Übergang zu erneuerbaren Energien.
Die „Helmholtz Energy- and Resource-awareness Operation for Artificial Intelligence“ (AI-HERO) ist ein Zusammenschluss von Wissenschaftlerinnen und Wissenschaftlern aus vier Helmholtz-Inkubatorplattformen an zwei verschiedenen Helmholtz-Zentren. Gemeinsam wollen Mitglieder von Helmholtz AI, Helmholtz Imaging, Helmholtz Metadata Collaboration HMC und die Graduiertenschule HIDSS4Health das Bewusstsein für den Energieverbrauch moderner KI-Forschung und -Entwicklung schärfen und zur Verbreitung von „Green IT“-Ansätzen beitragen.
Energie sparen bei KI-Modellen
Anfang Februar 2022 hat das Team aus KI-Forscherinnen und -Forschern des Karlsruher Instituts für Technologie KIT und des Deutschen Krebsforschungszentrums DKFZ deshalb einen dreitägigen, virtuellen Hackathon veranstaltet. Das Ziel: energieeffiziente KI-Modelle entwickeln, die bei Modellentwicklung, -training und -vorhersage möglichst wenig Strom verbrauchen.
19 Teilnehmerinnen und Teilnehmer aus zehn verschiedenen Helmholtz-Zentren und Partneruniversitäten bzw. Forschungseinrichtungen nahmen an dem Hackathon teil, und bearbeiteten in Dreier-Teams entweder einen Anwendungsfall aus dem Bereich Energie oder aus dem Bereich Gesundheit: Im Use Case Gesundheit sollten die Teilnehmenden ein Modell entwickeln, das eine COVID-19-Infektion anhand von Röntgenbildern möglichst zuverlässig vorhersagt. Die für das Training verwendeten Daten wurden in verschiedenen Krankenhäusern aufgenommen und im Rahmen der COVID-Net Open Initiative gesammelt. Im Use Case Energie war die Aufgabe eine Vorhersage der elektrischen Last: Basierend auf Daten des stündlichen Stromverbrauchs verschiedener Städte, gemessen über drei Jahren, sollte der zukünftige Verbrauch für einen Zeitraum von einer Woche vorhergesagt werden.
Wichtig für die Bewertung: Open Science-Maßstäbe
Für die Entwicklung, das Training und die Inferenz der Modelle wurde der Helmholtz AI Computing Resources (HAICORE)-Partition des KIT Supercomputers HoreKa verwendet. Durch den Einsatz von Lenovos „XClarity Controller“ und einem neuartigen SLURM-Plugin ermöglicht HoreKa eine hochaufgelöste Messung des Stromverbrauchs pro Knoten. Während des gesamten Hackathons konnte so der Stromverbrauch aller auf dem Hochleistungsrechner durchgeführten Berechnungen überwacht und der Gesamtverbrauch für die Modellentwicklung gemessen werden. Um die Grundsätze von Open Science aktiv zu befördern, ist in die Evaluierung der von den Teams entwickelten finalen Modelle die Berücksichtigung der FAIR-Grundsätze (Findable, Accessible, Interoperable, Reproducible) explizit eingeflossen: Die Teams haben die fertigen, trainierten Modelle auf Zenodo hochgeladen, den zugehörigen Code auf GitHub veröffentlicht, so dass sie anschließend vom AI-HERO-Team auf dem Testdatensatz angewendet werden konnten. Dadurch konnten die Modelle unabhängig in Bezug sowohl auf ihre Leistung und ihren Energieverbrauch als auch auf ihre Reproduzierbarkeit bewertet werden.
Im Anwendungsfall „Energie“ gewann das Team „Dynamic Ants“ vom Helmholtz-Zentrum Hereon mit einem DeepAR-Ansatz: Damit gelang es ihnen, das Modell mit der höchsten Vorhersage-Genauigkeit zu entwickeln, während ihr gesamter Entwicklungsprozess nur 1,74 MJ verbrauchte. Dies war rund ein Drittel des Energieverbrauchs des zweitplatzierten Teams „Red Warriors“. Auch in der Inferenz konnte das Modell der „Dynamic Ants“ mit einem Energieverbrauch von 36,39 kJ überzeugen. Im Anwendungsfall Gesundheit machte das Team „Skeleton Suns“ vom DKFZ das Rennen um den ersten Platz. Ihr auf einem ResNet-18 basierendes Modell war zwar nur das zweitbeste im Ranking des Entwicklungs-Energieverbrauchs (22,10 MJ), resultierte aber in der höchsten Genauigkeit (66,43 %) und einem geringen Stromverbrauch in der Inferenz (106,64 kJ).
Alle Modelle und Ergebnisse können unter https://ai-hero-hackathon.de/ eingesehen werden. Die teilnehmenden Teams erhielten Preise, die von Lenovo gesponsert wurden. Lenovo bot auch ein Rahmenprogramm mit Vorträgen zum Thema Green AI und zum Industrieansatz von Lenovo für energieeffiziente IT- und Computerhardware statt. Die Veranstaltung wurde durch HIDA und NHR@KIT unterstützt.